在本文中,我们介绍了一种基于数学的数学优化的方法来构建多种单件实例的树形分类规则。我们的方法包括构建分类树,除了叶节点之外,暂时遗漏标签并通过SVM分离超平面分为两个类。我们提供了一个混合整数非线性编程配方,用于问题,并报告电池的扩展电池的结果,以评估我们关于其他基准分类方法的提案的性能。
translated by 谷歌翻译
Early detection of relevant locations in a piece of news is especially important in extreme events such as environmental disasters, war conflicts, disease outbreaks, or political turmoils. Additionally, this detection also helps recommender systems to promote relevant news based on user locations. Note that, when the relevant locations are not mentioned explicitly in the text, state-of-the-art methods typically fail to recognize them because these methods rely on syntactic recognition. In contrast, by incorporating a knowledge base and connecting entities with their locations, our system successfully infers the relevant locations even when they are not mentioned explicitly in the text. To evaluate the effectiveness of our approach, and due to the lack of datasets in this area, we also contribute to the research community with a gold-standard multilingual news-location dataset, NewsLOC. It contains the annotation of the relevant locations (and their WikiData IDs) of 600+ Wikinews articles in five different languages: English, French, German, Italian, and Spanish. Through experimental evaluations, we show that our proposed system outperforms the baselines and the fine-tuned version of the model using semi-supervised data that increases the classification rate. The source code and the NewsLOC dataset are publicly available for being used by the research community at https://github.com/vsuarezpaniagua/NewsLocation.
translated by 谷歌翻译
重要性采样(IS)是一种强大的蒙特卡洛(MC)方法,用于近似积分,例如在贝叶斯推论的背景下。在IS中,从所谓的提案分布中模拟样品,并且该提案的选择是实现高性能的关键。在自适应IS(AIS)方法中,一组建议是迭代改进的。 AIS是一种相关和及时的方法论,尽管仍有许多局限性尚待克服,例如,高维和多模式问题的维度诅咒。此外,汉密尔顿蒙特卡洛(HMC)算法在机器学习和统计数据中变得越来越流行。 HMC具有几个吸引人的特征,例如其探索性行为,尤其是在其他方法遭受的情况下,尤其是在高维目标中。在本文中,我们介绍了新型的汉密尔顿自适应重要性采样(HAIS)方法。 Hais使用平行的HMC链实现了两步自适应过程,每次迭代都合作。拟议的HAI有效地适应了一系列建议,从而提取了HMC的优势。 HAI可以理解为具有额外重采样步骤的通用分层AIS家族的特定实例。 HAIS在高维问题W.R.T.方面取得了重大的绩效提高。最先进的算法。我们讨论了HAI的统计特性,并在两个具有挑战性的例子中显示了其高性能。
translated by 谷歌翻译
大多数人工智能(AI)研究都集中在高收入国家,其中成像数据,IT基础设施和临床专业知识丰富。但是,在需要医学成像的有限资源环境中取得了较慢的进步。例如,在撒哈拉以南非洲,由于获得产前筛查的机会有限,围产期死亡率的率很高。在这些国家,可以实施AI模型,以帮助临床医生获得胎儿超声平面以诊断胎儿异常。到目前为止,已经提出了深度学习模型来识别标准的胎儿平面,但是没有证据表明它们能够概括获得高端超声设备和数据的中心。这项工作研究了不同的策略,以减少在高资源临床中心训练并转移到新的低资源中心的胎儿平面分类模型的域转移效果。为此,首先在丹麦的一个新中心对1,008例患者的新中心进行评估,接受了1,008名患者的新中心,后来对五个非洲中心(埃及,阿尔及利亚,乌干达,加纳和马拉维进行了相同的表现),首先在丹麦的一个新中心进行评估。 )每个患者有25名。结果表明,转移学习方法可以是将小型非洲样本与发达国家现有的大规模数据库相结合的解决方案。特别是,该模型可以通过将召回率提高到0.92 \ pm 0.04 $,同时又可以维持高精度。该框架显示了在临床中心构建可概括的新AI模型的希望,该模型在具有挑战性和异质条件下获得的数据有限,并呼吁进行进一步的研究,以开发用于资源较少的国家 /地区的AI可用性的新解决方案。
translated by 谷歌翻译
自成立以来,建立在广泛任务中表现出色的普通代理的任务一直是强化学习的重要目标。这个问题一直是对Alarge工作体系的研究的主题,并且经常通过观察Atari 57基准中包含的广泛范围环境的分数来衡量的性能。 Agent57是所有57场比赛中第一个超过人类基准的代理商,但这是以数据效率差的代价,需要实现近800亿帧的经验。以Agent57为起点,我们采用了各种各样的形式,以降低超过人类基线所需的经验200倍。在减少数据制度和Propose有效的解决方案时,我们遇到了一系列不稳定性和瓶颈,以构建更强大,更有效的代理。我们还使用诸如Muesli和Muzero之类的高性能方法证明了竞争性的性能。 TOOUR方法的四个关键组成部分是(1)近似信任区域方法,该方法可以从TheOnline网络中稳定引导,(2)损失和优先级的归一化方案,在学习具有广泛量表的一组值函数时,可以提高鲁棒性, (3)改进的体系结构采用了NFNET的技术技术来利用更深的网络而无需标准化层,并且(4)政策蒸馏方法可使瞬时贪婪的策略加班。
translated by 谷歌翻译
智能机器真的聪明吗?智力的基本哲学概念是否令人满意地描述当前系统的工作方式?了解智力的必要条件吗?如果一台机器能理解,我们应该将主观性归因于它吗?本文解决了决定所谓的“智能机器”是否能够理解而不是仅仅处理标志的问题。它处理语法和语义之间的关系。主要论文涉及语义的必然性对于建造有意识机器的可能性的任何讨论,并凝结为以下两个原则:直觉”; “如果语义不能简化为语法,那么机器就无法理解。”我们的结论指出,没有必要将理解归因于机器以解释其表现出的“智能”行为。仅仅是句法和机械智力的方法作为解决任务的工具,足以证明它可以在技术发展的当前状态中显示的操作范围。
translated by 谷歌翻译
基于相关的回声声音浮标收集的数据,这些浮标附带了热带海洋中的鱼聚集设备(DFAD),当前的研究应用机器学习方案来检查金枪鱼学校关联的时间趋势以漂移对象。使用二进制输出,将文献中通常使用的指标适应以下事实,即考虑到DFAD下的整个金枪鱼聚合。金枪鱼首次在25至43天之间进行了金枪鱼的中位时间,取决于海洋,最长的浸泡和殖民时间在太平洋中注册。金枪鱼学校的连续停留时间通常比连续缺勤时间(分别在5到7天和9天和11天之间)短,与以前的研究结果一致。使用回归输出,估计两个新型指标,即聚集时间和分解时间,以进一步了解聚集过程的对称性。在所有海洋中,金枪鱼聚合离开DFAD所需的时间并不比聚集形成所花费的时间大得多。讨论了这些结果在“生态陷阱”假设的背景下的价值,并提出了进一步的分析以丰富和利用该数据源。
translated by 谷歌翻译
逻辑神经网络(LNNS)是一种结合神经网络学习能力和正式逻辑能力的能力的体系结构。LLNS为程序员提供了通过逻辑公式隐式修改神经网络的基础结构的能力。在本文中,我们利用此抽象来扩展LNN,以通过一阶理论支持平等和功能符号。这种扩展通过显着增加了他们可以解决的问题的类型来提高LNN的功能。作为概念的证明,我们为IBM的LNN库增加了对平等的一阶理论的支持,并演示了此引入如何允许LNN库现在推理出表达式而无需做出独特的名称假设。
translated by 谷歌翻译
智能测试的分辨率,特别是数值序列,对AI系统的评估引起了极大的兴趣。我们提出了一种称为Kitbit的新计算模型,该模型使用简化的算法及其组合来构建一个预测模型,该模型在数值序列中找到了基础模式,例如IQ测试中包含的模型以及更复杂的其他模型。我们介绍了该模型的基础及其在不同情况下的应用。首先,对从各种来源收集的智商测试中使用的一组数字系列进行了测试。接下来,我们的模型已成功应用于用于评估文献报道的模型的序列。在这两种情况下,系统都可以使用标准计算能力在不到一秒钟的时间内解决这些类型的问题。最后,Kitbit的算法首次应用于著名的OEI数据库的整个序列的完整集。我们以算法列表的形式找到了一个模式,并在迄今为止最大的系列数量中预测了以下术语。这些结果证明了kitbit解决可以用数值表示的复杂问题的潜力。
translated by 谷歌翻译
仇恨言论与用户生成的内容一起困扰网络空间。本文调查了对话环境在在线仇恨和反语音的注释和检测中的作用,其中将上下文定义为对话线程中的前面评论。我们创建了一个上下文感知的数据集,用于在Reddit评论上进行三向分类任务:仇恨言语,反语音或中立。我们的分析表明,上下文对于识别仇恨和反语音至关重要:大多数评论的人类判断都会根据我们是否向注释者展示上下文而改变。语言分析吸引了人们用来表达仇恨和反语言的语言的见解。实验结果表明,如果考虑到上下文,神经网络将获得明显更好的结果。我们还提出了定性错误分析,将灯光放到(a)何时以及为什么有益的情况下以及(b)考虑到上下文时我们最佳模型造成的其余错误。
translated by 谷歌翻译